Einführung in die Distributionelle Semantik
Die Bedeutung sprachlicher Zeichen: Bedeutungstheorien
Die Bedeutung sprachlicher Zeichen liegt...
-
...in ihrer Beziehung zu Dingen in der Welt.
➔ realistische Antwort (Wittgenstein, Carnap, Montague)
-
...in ihrer Zuordnung zu mentalen Repräsentationen (Konzepten).
➔ kognitivistische Antwort (Lakoff, Jackendoff, Fodor)
-
...in ihrem Gebrauch.
➔ gebrauchstheoretische Antwort (Wittgenstein, Austin, Grice)
Vgl. ausführlich zur distributionellen Semantik und Bedeutungstheorien generell: Studienbuch Linguistik: 101ff., Kapitel 3
Ludwig Wittgenstein
Man kann für eine grosse Klasse von Fällen der Benützung des Wortes ‘Bedeutung’ – wenn auch nicht für alle Fälle seiner Benützung – dieses Wort so erklären: Die Bedeutung eines Wortes ist sein Gebrauch in der Sprache.
(Wittgenstein, Ludwig: Philosophische Untersuchungen, 1952)
John Rupert Firth
You shall know a word by the company it keeps.
(Firth, J. R. 1957:11)
Semantische Räume
Ausgangspunkt: Kollokationsprofil
- Maske: tragen, nützen, ohne, schützen, Abstand, Tragen, kein, FFP2, anziehen, ÖV, mit, Pflicht, nichts, Desinfektionsmittel, Handschuh, Maske, FFP3, FFP, eine, bringen, kaufen, Schutz, ziehen, einkaufen, aufsetzen, getragen, genügend, Kinn, Nase, Hygiene, Träger, chirurgisch, rumlaufen…
- Hygienemaske: eine, tragen, Raum, geschlossen, schützen, mit, wer, Träger, nur, normal, Schutz, kaufen, “, in, vor, bei, also, du, einfach, werden, Maske, oder, sie wenn, die, dass, sollen, (, müssen, immer, auch…
Matrix
| tragen | schützen | Krankheit | Tür | Gleis | … | |
|---|---|---|---|---|---|---|
| Virus | 4 | 15 | 30 | 0 | 0 | |
| Hygienemaske | 18 | 21 | 20 | 1 | 0 | |
| Maske | 20 | 20 | 15 | 1 | 0 | |
| Haus | 1 | 5 | 3 | 22 | 1 | |
| Bahnhof | 2 | 0 | 0 | 2 | 25 | |
| … |
Vektoren

- Darstellung der Kollokationsprofile im Vektorraum
- im Beispiel: nur zwei Dimensionen; richtiges Modell: 33.000 Dimensionen (Dimensionsreduktion auf 100)
- Distanz zwischen den Punkten: Ausdruck von semantischer Nähe
- neuronales Lernen (Deep Learning) der Ähnlichkeit der Vektoren – verschiedene Verfahren, z.B. word2vec (Mikolov et al. 2013)
Vorberechnete Modelle
- Vorberechnete Modelle Englisch – inkl. Vektorgeometrie: http://vectors.nlpl.eu/explore/embeddings/en/
- Vorberechnete Modelle Korpusplattform Bubenhofer: https://korpuspragmatik.ds.uzh.ch/tensorboard/#projector&run=.
- Vorberechnete Modelle Korpusplattform Bubenhofer zum Download: https://gitlab.uzh.ch/noah.bubenhofer/zukoko/-/tree/master/2A_Korpuspragmatik/Material/- - wordembeddings → Darstellung der Modelle mit https://projector.tensorflow.org
- DeReKoVecs (Basis DeReKo, IDS): https://corpora.ids-mannheim.de/derekovecs
- Alte Version von Cyril Belica: https://corpora.ids-mannheim.de
Literatur
Anwendungen
Bubenhofer, Noah (2022): Exploration semantischer Räume im Corona-Diskurs. In: Sprache in Politik und Gesellschaft: Perspektiven und Zugänge. Mannheim (Jahrbuch des Instituts für Deutsche Sprache).
Bubenhofer, Noah (2021): Masken und Küsschen: Korpuslinguistische Exploration des Corona-Diskurses in der Deutschschweiz. In: Mitteilungen des Deutschen Germanistenverbandes. 68 (2), S. 127–140.
Bubenhofer, Noah (2020): Semantische Äquivalenz in Geburtserzählungen: Anwendung von Word Embeddings. In: Zeitschrift für germanistische Linguistik. 48 (3), S. 562–589, doi: 10.1515/zgl-2020-2014.
Bubenhofer, Noah; Calleri, Selena; Dreesen, Philipp (2019): Politisierung in rechtspopulistischen Medien: Wortschatzanalyse und Word Embeddings. In: OBST. Osnabrücker Beiträge zur Sprachtheorie. (95), S. 211–242.
Literatur zu Word Embeddings
Lenci, Alessandro (2018): Distributional Models of Word Meaning. In: Annual Review of Linguistics 4 (1), S. 151–171. doi:10.1146/annurev-linguistics-030514-125254.
Kozlowski, Austin C./Taddy, Matt/Evans, James A. (2018): The Geometry of Culture: Analyzing Meaning through Word Embeddings. In: CoRR abs/1803.09288,.
Mikolov, Tomas/Chen, Kai/Corrado, Greg/Dean, Jeffrey (2013): Efficient Estimation of Word Representations in Vector Space. In: arXiv:1301.3781 [cs],.
Mikolov, Tomas/Sutskever, Ilya/Chen, Kai/Corrado, Greg/Dean, Jeffrey (2013): Distributed Representations of Words and Phrases and their Compositionality. In: arXiv:1310.4546 [cs, stat],.